## Aykırı Değer (Outlier) Nedir?
Aykırı değer (İngilizce: Outlier), bir veri setindeki diğer gözlemlerden önemli ölçüde farklılık gösteren, aşırı uçta bulunan değerlerdir. Bu değerler, veri setinin genel dağılımına uymaz ve çeşitli nedenlerle ortaya çıkabilirler:
* **Ölçüm Hataları:** Veri toplama sürecinde yapılan hatalar (örneğin, yanlış okuma, cihaz arızası).
* **Veri Giriş Hataları:** Verilerin elle girilmesi sırasında yapılan hatalar (örneğin, yanlış yazım, yanlış birim kullanımı).
* **Doğal Varyasyon:** Verinin doğasından kaynaklanan aşırı uç değerler (örneğin, çok nadir görülen bir olay).
* **Gerçek Anormallikler:** Veri setinde gerçekten var olan ve incelenmesi gereken olağandışı durumlar.
### Aykırı Değerlerin Önemi
Aykırı değerler, istatistiksel analizleri ve makine öğrenimi modellerini önemli ölçüde etkileyebilir. Ortalamayı, standart sapmayı ve regresyon modellerini bozabilirler. Bu nedenle, aykırı değerlerin belirlenmesi ve uygun şekilde ele alınması önemlidir.
### Aykırı Değerleri Belirleme Yöntemleri
Aykırı değerleri belirlemek için çeşitli yöntemler kullanılır:
* **Görsel Yöntemler:** Histogramlar, kutu çizimleri (box plots) ve saçılım diyagramları (scatter plots) gibi grafikler kullanılarak aykırı değerler görsel olarak tespit edilebilir.
* **İstatistiksel Yöntemler:**
* **Z-Skoru (Z-score):** Bir verinin ortalamadan kaç standart sapma uzakta olduğunu gösterir. Belirli bir eşik değerinin (örneğin, 3 veya -3) üzerindeki Z-skorları aykırı değer olarak kabul edilebilir. ([Z-Skoru Nedir?](https://www.nedemek.page/kavramlar/Z-Skoru))
* **IQR (Interquartile Range) Yöntemi:** Veri setinin çeyrekler açıklığı kullanılarak aykırı değerler belirlenir. Belirli bir eşik değerinin (örneğin, 1.5 * IQR) üzerindeki veya altındaki değerler aykırı olarak kabul edilir.
* **Makine Öğrenimi Yöntemleri:** Kümeleme algoritmaları (örneğin, K-Means), izolasyon ormanları (isolation forests) ve tek sınıf SVM (one-class SVM) gibi yöntemler kullanılarak aykırı değerler otomatik olarak tespit edilebilir.
### Aykırı Değerlerle Başa Çıkma Yöntemleri
Aykırı değerler tespit edildikten sonra, bunlarla başa çıkmak için çeşitli yöntemler uygulanabilir:
* **Silme:** Aykırı değerler veri setinden tamamen çıkarılabilir. Bu yöntem, aykırı değerlerin hatalı verilerden kaynaklandığı durumlarda uygun olabilir.
* **Dönüştürme:** Veri dönüştürme teknikleri (örneğin, log dönüşümü, karekök dönüşümü) kullanılarak aykırı değerlerin etkisi azaltılabilir.
* **Değiştirme:** Aykırı değerler, daha kabul edilebilir değerlerle (örneğin, ortalama, medyan, alt veya üst sınır değerleri) değiştirilebilir.
* **Ayrı Analiz:** Aykırı değerler ayrı bir analiz konusu olarak ele alınabilir. Bu, aykırı değerlerin neden ortaya çıktığını anlamaya ve veri setinde önemli bir anormalliği temsil edip etmediğini belirlemeye yardımcı olabilir. ([Veri Analizi Nedir?](https://www.nedemek.page/kavramlar/Veri%20Analizi))
Aykırı değerlerin ele alınması, analiz amacına, veri setinin özelliklerine ve aykırı değerlerin nedenlerine bağlı olarak değişir.
Ne Demek sitesindeki bilgiler kullanıcılar vasıtasıyla veya otomatik oluşturulmuştur. Buradaki bilgilerin doğru olduğu garanti edilmez. Düzeltilmesi gereken bilgi olduğunu düşünüyorsanız bizimle iletişime geçiniz. Her türlü görüş, destek ve önerileriniz için iletisim@nedemek.page